Aller au contenu principal

Exploration de la donnée

L'environnement que l'on appelle Bac à Sable ou sandbox est dédié à l'exploration de la donnée. Pour cela il s'appuie sur plusieurs outils :

  • L'exploration de données (dataviz) est réalisée avec l'outil Superset (et Trino) : Dataviz
  • La mise au point d'algorithmes (datalab) est réalisée avec l'outil Jupyter : Datalab

Des espaces de stockage dédiés au Bac à Sable sont créés par l'Administrateur données. Ces espaces distincts de ceux de production, sont accessibles en lecture et écriture depuis le Bac à Sable.

Depuis l'environnement du Bac à Sable, il est également possible de lire des données de production. Depuis l'environnement du Bac à Sable, il est également possible de lire et écrire des données de l'EID.

Tous les espaces de stockage utilisés dans le Bac à Sable doivent être créés au préalable.

Le Bac à Sable est accessible aux utilisateurs métiers en fonction de leur rôle métier.

Alimentation des données

Le datascientist peut utiliser des EdS déjà existants et il peut également demander à l'Administrateur données la création d'espaces de stockage dédiés au Bac à Sable pour des besoins spécifiques.

Si le data scientist a besoin d'utiliser des données qui ne sont pas encore dans le socle, il utilise le composant Data Ingestion pour alimenter un espace auquel l'Administrateur données lui a donné accès.